O dicionario de sinónimos como recurso para a expansión de WordNet

نویسندگان

  • Xavier Gómez Guinovart
  • Miguel Anxo Solla Portela
چکیده

Esta investigación reaĺızase no marco do proxecto Adquisición de escenarios de conocimiento a través de la lectura de textos: Desarrollo y aplicación de recursos para el procesamiento lingǘıstico del gallego (SKATeR-UVIGO) financiado polo Ministerio de Economı́a y Competitividad, TIN2012-38584-C06-04. Queremos agradecer aqúı sinceramente as valiosas contribucións para a mellora do artigo das tres persoas expertas –Hugo Gonçalo Oliveira, da Universidade de Coimbra; Álvaro Iriarte Sanromán, da Universidade do Minho; e Mercè Lorente Casafont, da Universitat Pompeu Fabra– que realizaron a revisión previa á súa aceptación por parte da revista. http://nlp.lsi.upc.edu/skater/ tado á ampliación do WordNet do galego mediante a explotación dos datos lexicográficos recollidos nun dicionario de sinónimos “tradicional” desta lingua. En principio, as caracteŕısticas de WordNet (Miller et al., 1990) como rede léxico-semántica estruturada en nós conceptuais (synsets) compostos por variantes léxicas dun mesmo significado permitiŕıan inferir sen dificultades a hipótese de que os dicionarios de sinónimos existentes dunha lingua constitúen fontes lexicográficas directas moi axeitadas para a expansión deste recurso. Porén, os experimentos previos de extensión do WordNet do galego a partir dun dicionario de sinónimos realizados polos autores (Gómez Guinovart, 2014) (Solla Portela e Gómez Guinovart, 2014) demostran as dificultades de acadar mediante este recurso uns ı́ndices de precisión que permitan a validacion manual dos resultados da extracción nun tempo razoábel. As causas desta dificultade radican principalmente no distinto concepto de sinonimia utilizado por cada un destes dous recursos, moito máis estrito e delimitado pola glosa no WordNet (Gómez Clemente et al., 2013), moito máis laxo e abranguente doutras relacións semánticas no dicionario de sinónimos tradicional. Deste xeito, mentres que o concepto de sinonimia manexado en WordNet fai referencia ao concepto máis espećıfico de sinonimia contextual ou intercambiabilidade dos sinónimos limitada a un contexto (Miller, 1998), no dicionario de sinónimos tradicional as relacións semánticas entre o lema e os “sinónimos” que forman parte da entrada pode ser tanto de sinonimia, como de hiperonimia, hiponimia, holonimia, meronimia, troponimia ou implicación, entre outras. Aśı, por exemplo, no dicionario de sinónimos usado neste experimento, a entrada para o lema climaterio (“peŕıodo da vida do home e da muller en que se producen unha serie de cambios no organismo debidos á diminución da actividade das glándulas sexuais”) está formada polos seus dous hipónimos andropausa (isto é, o climaterio mas-

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Ampliación de WordNet mediante extracción léxica a partir de un diccionario de sinónimos

1. Introducción El objetivo del experimento presentado en este trabajo es la expansión del WordNet gallego mediante extracción léxica a partir de un diccionario de sinónimos de esta lengua. El experimento se realiza dentro del proyecto coordinado SKATeR en el que nuestro grupo tiene como objetivo prioritario la construcción de Galnet, la versión gallega del WordNet 3.0. El marco de desarrollo e...

متن کامل

VerbLexPor: um recurso léxico com anotação de papéis semânticos para o português (VerbLexPor: a lexical resource annotated with semantic roles for Portuguese)

Semantic role labeling offers vital information for both Linguistics and Natural Language Processing tasks. In this article, we present a lexical resource for Portuguese annotated with semantic roles: VerbLexPor. The resource is a database with verbs and sentences extracted from both a domain specific corpus and a non-specialized generic one. Annotation was manually carried out by a linguist us...

متن کامل

Los objetos de aprendizaje como recurso de calidad para la docencia: criterios de validación de objetos en la Universidad Politcnica de Valencia

En los últimos años se ha producido un fuerte impulso hacia la integración de las Tecnologías de la Información y Comunicaciones (TIC) en la educación, y más concretamente en el ámbito de la educación superior, continuamente surgen propuestas y trabajos relacionados con el uso de las Nuevas Tecnologías como recurso para la docencia. El presente artículo muestra, por un lado el PLAN DE DOCENCIA ...

متن کامل

Extracção de relações semânticas entre palavras a partir de um dicionário: o PAPEL e a sua avaliação

Neste artigo apresentamos o PAPEL, um recurso lexical para o português, constitúıdo por relações entre palavras, extráıdas de forma automática de um dicionário da ĺıngua geral através da escrita manual de gramáticas para esse efeito. Depois de contextualizarmos o tipo de recurso e as opções tomadas, fornecemos uma visão do processo da sua construção, apresentando as relações inclúıdas e a sua q...

متن کامل

Internet como fuente de información léxica: extracción de etiquetas de dominio y detección de nuevos sentidos

Resumen Describimos un algoritmo que combina información léxica (extráıda de WordNet 1.6) con información en Internet (directorios de Altavista) para caracterizar automáticamente los sentidos de una palabra con etiquetas de dominio y, al mismo tiempo, detectar y describir nuevos sentidos relevantes en Internet. Esta información puede utilizarse, entre otras cosas, para enriquecer bases de datos...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:
  • Linguamática

دوره 6  شماره 

صفحات  -

تاریخ انتشار 2014